Web 2.0 a era da colaboração coletiva como fonte de informação
Web Semântica e Biblioteconomia
1. WEB SEMÂNTICA: EM BUSCA DA WEB INTELIGENTE
Naira Michelle Alves Pereira¹; Gracy Kelli Martins²
¹ Estudante do Curso de Biblioteconomia da Universidade Federal do Ceará – Campus Cariri,
E-mail: nairamichelle_ufc@yahoo.com.br
² Professora do Curso de Biblioteconomia da Universidade Federal do Ceará, Campus Cariri,
E-mail: gracy.martins@cariri.ufc.br
Resumo
A popularização e uso de computadores conectados à Internet permitiu que a Web se tornasse
parte integrante de nossas vidas. A principal causa do grande sucesso da web é a sua liberdade
de publicação de informação e facilidade de manipulação. Essa liberdade e facilidade têm
provocado um crescimento exponencial no número de usuários e quantidade de informações
produzidas e disponíveis, ocasionando assim, problemas de semântica e ambigüidade, por
falta de regras de estrutura, catalogação e indexação dos recursos por seus criadores. Nessa
perspectiva surgiu o projeto Web Semântica, idealizado por Berners-Lee (2001) que propõe
ordenar a confusão informacional existente na web. O presente artigo apresenta uma revisão
de literatura abordando conceitos e estudos sobre a Web Semântica, objetivando incentivar
estudantes de Biblioteconomia à investigação de pesquisas, fomentando as técnicas de
representação da informação, já utilizadas na área da Biblioteconomia, para o
desenvolvimento de tecnologias voltadas ao processo de representações semânticas no
ambiente web. Conclui-se que no atual ambiente web, a partir dos recursos da web 2.0, as
informações não possuem estruturas padronizadas, o que dificulta o processo de recuperação
da informação por máquinas/agentes computacionais. Nessa ótica, percebe-se que, o
profissional bibliotecário com seus conhecimentos de representação da informação pode
contribuir para o desenvolvimento efetivo de linguagens de representação desse perfil
semântico na Web, pois as técnicas de indexação e catalogação utilizadas pela
biblioteconomia poderão contribuir para os estudos relacionados às tecnologias mais
sofisticadas de estruturação e representação semântica das informações na rede.
Palavras-chave: Representação da Informação; Biblioteconomia; Profissional Bibliotecário.
Introdução
A popularização e uso de computadores conectados a Internet permitiu que a Web se
tornasse parte integrante de nossas vidas. A primeira geração da Web foi constituída por
páginas estáticas, confeccionadas à mão e individualmente. Já a sua segunda geração, a Web
2.0, é composta por páginas dinâmicas onde a participação do homem na criação de
conteúdos tem promovido uma maior interatividade. Em conseqüência, o número de usuários
e quantidade de informações disponíveis na rede aumenta a cada dia, produzindo um acúmulo
de informações desorganizadas de maneira exponencial. Diante disso, as ferramentas de busca
nem sempre conseguem filtrar informações relevantes para os usuários, refletindo a
necessidade da padronização dessas informações para uma melhor recuperação.
Nessa perspectiva, surge a Web semântica, que nasce como um possível recurso para
que a informação seja padronizada, compreendida e recuperada, não apenas pelos seres
humanos, mas também pelas máquinas, “na forma de agentes computacionais que são capazes
de operar eficientemente sobre as informações, podendo entender seus significados, ou seja,
incorporar semânticas às informações” (PINHEIRO, 2009, p. 24). Buscou-se analisar, através
2. da revisão de publicações disponíveis na web, conceitos e informações sobre a Web
Semântica com o propósito de desperta o interesse de estudantes de Biblioteconomia no
desenvolvimento de pesquisas nessa área. Bem como, apontar a importância das técnicas
tradicionais de representação da informação, estabelecidas na Biblioteconomia, como
indexação e catalogação, como base para os processos metodológicos de estruturação,
recuperação e representação semântica dos recursos informacionais existentes na Web,
contribuindo assim para a construção da Web Semântica.
Percebe-se que na Web, as informações não possuem estruturas padronizadas, e por
isso podem ser irregulares, incompletas, parciais e podem mudar com freqüência., causando
uma precariedade em sua estrutura que dificulta o processo de recuperação da informação por
máquinas, ou seja, agentes computacionais. “A busca de soluções para este problema está na
proposta de Berners-Lee,o criador da web, para uma nova geração da web, denominada Web
Semântica” (ROCHA, 2004, p. 117), que foca seus estudos para que as informações possam
ser compreendidas por máquinas, na forma de agentes computacionais capazes de operar
eficientemente sobre as informações incorporando semântica nas relações conceituais
estabelecida por tais informações. (PINHEIRO, 2009).
Materiais e Métodos
Trata-se de uma pesquisa exploratória com abordagem bibliográfica, que tem como
recorte os problemas de organização da informação na web, de forma a facilitar a recuperação
da super-oferta de informação disponível. Este artigo analisou através de um levantamento
bibliográfico: conceitos, informações e tecnologias associadas ao projeto W3 Consortium1
, ou
Web 3.0, mostrando seus objetivos e relevância na otimização dos mecanismos de busca,
recuperação e representação de recursos informacionais. Também foi evidenciada a
importância das técnicas tradicionais da Biblioteconomia na representação da informação, e a
demonstração de forma gráfica das diferenças entre os perfil atual da Web 2.0 e os benefícios
na implantação da Web semântica.
Resultados e discussões
O armazenamento, controle, organização e recuperação da informação na internet são
um dos maiores problemas atuais ocorridos no ambiente web. O enorme volume e diversidade
de informações disponíveis na rede vêm agravando esse quadro devido a falta de estrutura
definida de registros e campos.
Além da falta de estrutura, com o crescimento desordenado da rede, não existe ainda
[...] padrões universais para a organização dos documentos, como os que existem
para bibliotecas e arquivos. A indexação de páginas Web é feita de maneira precária
(através de informações chamadas metatags que são adicionadas ao documento pelo
criador das páginas) ou, na maioria das vezes, elas simplesmente não são indexadas.
São poucos os recursos organizados por profissionais com o conhecimento de
técnicas de indexação e catalogação (CENDÓN, 2007, p. 296).
Diante desses fatos, estudos estão sendo desenvolvidos para inserção de tecnologias
mais sofisticadas nos mecanismos de busca, que possam garantir a recuperação, representação
e estruturação dos recursos na internet, fazendo surgir assim perspectivas para uma próxima
geração da Web, projeto este, denominado Web Semântica.
1
O World Wide Consortium, ou W3C, foi criado em outubro de 1994 para liderar o desenvolvimento da World
Wide Web em relação às suas tecnologias e interoperabilidade. O consórcio conta com várias organizações-
membros, espalhadas por todo o mundo, que buscam oferecer especificações normativas e metodologias para as
tecnologias desenvolvidas na web semântica.
3. Seu idealizador, Berners-Lee, aponta que “A Web Semântica não é uma Web
separada, mas uma extensão da Web atual na qual as informações apresentam significados
bem definidos e permite que computadores e pessoas possam trabalhar em cooperação”
(BERNERS-LEE, HENDLER, LASSILA, 2001 apud ALVES, 2005, P.27).
Diante desse conceito na tabela 1 destacam-se as diferenças entre a Web 2.0 e a Web
Semântica:
Tabela 1: Diferenças entre a Web 2.0 e a Web Semântica
Web 2.0 Web semântica
Origem Evolução natural da Web Proposta de Berners-Lee para
revolucionar a
Web.
Implantação Muito alta Escassa
Coordenação Não existe W3C
Foco Pessoas Máquinas
Primeiras menções 2003 1999
Expressão Linguagem livre, expressado
mediante folksonomias, palavras-
chave denominadas tags, com
problemas de sinonímia e polissemia.
Linguagem controlada, mediante
linguagem de expressão de ontologias,
sistema de organização do conhecimento
e vocabulários
de metadados.
Algumas
Características
- Descrição de recursos para melhorar
sua distribuição gratuita
- Arquitetura de colaboração
- Usabilidade alta
- Um recurso é mais útil quanto mais
uso tem
- Utilização de uma linguagem
padronizada com sintaxe uniforme e
semântica não
ambígua.
- Interoperabilidade: troca de informação
entre qualquer repositório.
- Usabilidade escassa.
Fonte: Morato, J. et al. (2008 apud CARVALHO, 2009, p. 131).
Para o desenvolvimento da arquitetura informacional da Web 3.0, foram criadas
linguagens como a XML, desenvolvida para realizar a estruturação dos documentos criados
para Web e a RDF, uma linguagem que aplicará significado a essas estruturas, chamada
linguagem de marcação, onde será possível descrever a informação para que o computador
execute a inferência dos significados.
A Web Semântica está dividida em três níveis, ou camadas que são: camada
esquema, responsável por estruturar os dados e definir seu significado para elaboração do
raciocínio lógico; camada ontológica, objetiva definir padrões e relações entre os dados, e
camada lógica, composta por um conjunto de regras de inferência para que os agentes
possam utilizá-las com o objetivo de relacionar e processar informações.
Essas camadas mencionadas são a base para a construção e estabelecimento das
relações semânticas, ou seja, para que as informações apresentem significado bem definidos e
que sejam compreendidas pelas máquinas realizando os processos lógicos por meio de
inferências e possibilidades de recuperação precisa em resposta às buscas humanas.
Tais camadas, a partir das linguagens já mencionadas, estabelecem as relações
semânticas através de agentes computacionais, sendo capazes de operar eficientemente sobre
as informações e estabelecendo interoperabilidade entre sistemas e cooperação entre homem e
máquina. Logo, essa interoperabilidade é a capacidade de compartilhamento de
informações em diversos sistemas, que ocorre por meio de algumas ferramentas como
linguagem de marcação adequada, uso de metadados e arquiteturas de metadados, permitindo
que informações registradas e armazenadas em diferentes estruturas e em diferentes
comunidades do conhecimento possam ser intercambiadas e trocadas nestes sistemas, fazendo
com que haja um trabalho conjunto entre estes. (ALVES, 2005).
4. Conclusão
O objetivo da Web Semântica é viabilizar a criação de categorias para a representação
dos recursos informacionais existentes e disponíveis no ambiente web. Na Web Semântica, o
profissional bibliotecário com seus conhecimentos de representação da informação pode
contribuir para o seu desenvolvimento, pois as técnicas de indexação e catalogação utilizadas
pela biblioteconomia podem vir a servirem como essência para estudos relacionados ao
desenvolvimento de tecnologias e metodologias para a construção da Web Semântica.
Portanto, pode-se concluir que as metodologias para representação das informações na
Web Semântica é um processo ainda em construção e a Biblioteconomia, está em perfeita
sintonia com os estudos da área da Web Semântica, na medida em que ambos objetivam
aperfeiçoar a recuperação da informação para os usuários. Percebe-se que as atividades
desenvolvidas pelos bibliotecários como catalogar, indexar e classificar, para recuperação,
acesso e disseminação da informação são de fundamental importância para o processo de
estruturação e representação semântica dos recursos informacionais existentes na rede.
Agradecimentos
À Universidade Federal do Ceará pela oportunidade de crescimento intelectual e a
todo o corpo docente do curso de Biblioteconomia do Campus Cariri pelo apoio e estímulo na
reflexão e produção de estudos pertinentes à formação profissional.
Referências
ALVES, Rachel Cristina Vesú. WEB SEMÂNTICA: uma análise focada no uso de metadados.
Dissertação (Mestrado em Ciência da Informação), Universidade Estadual Paulista, Marília, 2005.
BERNERS-LEE, Tim; HENDLER, James ; LASSILA Ora. The Semantic Web: a new form of Web
content that is meaningful to computers will unleash a revolution of new possibilities. Scientific
American, n.5, may 2001.
CARVALHO, Rodrigo Aquino de. Perspectivas na Web Semântica para a Ciência da Informação.
2009. Dissertação (Mestrado em Ciência da Informação), Pontifícia Universidade Católica de
Campinas, PUC-Campinas, Campinas, 2009.
CENDÓN, Beatriz Valadares. A internet. In: CAMPELO, B. S.; CENDÓN, B. V.; KREMER, J. M.
(Org.). Fontes de informação para pesquisadores e profissionais. Belo Horizonte: Editora UFMG,
2007.
PINHEIRO, José Maurício. Web Semântica: rede de conceitos. Cadernos UniFOA, n. 9, p. 23-27,
abr. 2009.
ROCHA, Rafael Port da. Metadados,Web Semântica, Categorização Automática: combinando
esforços humanos e computacionais para a descoberta e uso dos recursos da web. Em Questão, Porto
Alegre, v. 10, n. 1, p. 109-121, jan./jun. 2004.